میدجرنی Midjourney یک پلتفرم مولد مبتنی بر هوش مصنوعی است که به کاربران اجازه می دهد آثار هنری منحصر به فردی مانند شخصیت‌ها، تصاویر را از طریق پیام‌های متنی کوتاه تولید کنند.

پلتفرم هوش مصنوعی مولد یک سیستم هوش مصنوعی است که می تواند محتوای جدید و منحصر به فرد، اغلب در تصاویر، متن یا سایر خروجی‌های خلاقانه تولید کند. برخلاف سیستم‌های هوش مصنوعی مبتنی بر قوانین سنتی که برای کارهای خاص طراحی شده‌اند، پلتفرم‌های هوش مصنوعی مولد از الگوریتم‌های پیشرفته، معمولاً مبتنی بر تکنیک‌های یادگیری عمیق، برای تولید مستقل خروجی‌های جدید و مرتبط با زمینه استفاده می‌کنند.

پلتفرم هوش مصنوعی مولد یک سیستم هوش مصنوعی است که می تواند محتوای جدید و منحصر به فرد، اغلب در تصاویر، متن یا سایر خروجی‌های خلاقانه تولید کند. برخلاف سیستم‌های هوش مصنوعی مبتنی بر قوانین سنتی که برای کارهای خاص طراحی شده‌اند، پلتفرم‌های هوش مصنوعی مولد از الگوریتم‌های پیشرفته، معمولاً مبتنی بر تکنیک‌های یادگیری عمیق، برای تولید مستقل خروجی‌های جدید و مرتبط با زمینه استفاده می‌کنند.

میدجرنی یکی از این پلتفرم‌های خلاقانه هوش مصنوعی است که فرصت‌های جدیدی را برای بیان خلاقانه باز می‌کند و می‌تواند خروجی‌هایی تولید کند که فراتر از آنچه به صراحت برنامه‌ریزی شده است، عنصر غیرقابل پیش‌بینی و خلاقیت را به چشم‌انداز هوش مصنوعی وارد کند. این را می توان در حوزههای مختلف آثار هنری اعمال کرد تا تصاویر واقعی ایجاد کند که در دنیای واقعی وجود ندارند.

Midjourney یک برنامه و خدمات هوش مصنوعی مولد توسط آزمایشگاه تحقیقاتی Midjourney، Inc است. تیم میدجرنی توسط دیوید هولز، یکی از بنیانگذاران Leap Motion هدایت می شود. مانند DALL-E OpenAI و Stable انتشار پایدار هوش مصنوعی، میدجرنی تصاویری را با استفاده از توضیحات زبان طبیعی به نام prompt ایجاد می کند.

وب‌سایت Midjourney خود را به‌عنوان «آزمایشگاه تحقیقاتی مستقلی که رسانه‌های فکری جدید را بررسی می‌کند و قدرت تخیل گونه‌ی انسانی را گسترش می‌دهد» توصیف می‌کند.

از 12 ژوئیه 2022 در نسخه بتای باز قرار گرفته است و کاربران می توانند با میدجرنی با استفاده از اعلان‌های ساده مبتنی بر متن در دستورات ربات Discord آثار هنری با کیفیت بالا ایجاد کنند. برای استفاده از Midjourney به سخت افزار یا نرم افزار تخصصی نیاز نیست. اما برای دسترسی به این سرویس، داشتن یک حساب کاربری Discord ضروری است.

میدجرنی از طریق تعامل پیچیده دو فناوری یادگیری ماشینی عمل می کند: مدل‌های زبان بزرگ LLM و مدل‌های انتشاری Diffusion Models. هنگامی که کاربران درخواست‌های ورودی را وارد می کنند، یک large language models معنای کلمات را رمزگشایی می کند و آن را به یک بردار عددی تبدیل می کند.

این بردار در هدایت فرآیند انتشار بسیار مهم است، جایی که Midjourney از یک مدل انتشار برای تبدیل نویز تصادفی به هنر جذاب بصری استفاده می کند. مدل‌های انتشار Diffusion Models شامل افزودن تدریجی نویز تصادفی به مجموعه داده‌های آموزشی از تصاویر است. این مدل با یادگیری معکوس کردن این نویز در طول زمان در تولید تصاویر کاملاً جدید ماهر می شود.

به عنوان مثال، اگر کاربر یک پیام متنی مانند «استخراج بیت‌کوین با رنگ‌های روشن و ظاهر متحرک» را وارد کند، میدجرنی با زمینه‌ای از نویز بصری شروع می‌کند. از طریق انتشار نهفته، یک مدل هوش مصنوعی آموزش‌دیده به طور سیستماتیک نویز را کم می‌کند و به تدریج تصویری را نشان می‌دهد که ماهیت اشیاء و مضامین مشخص‌شده را در اعلان اصلی مجسم می‌کند.

درک زبان و هم افزایی مدل‌سازی انتشار، Midjourney را قادر می‌سازد تا آثار هنری جذاب و متنوع تولید شده توسط هوش مصنوعی را بر اساس ورودی یا درخواست‌های کاربر بسازد.

دسترسی به نسخه بتا Midjourney فقط از طریق حساب Discord امکان پذیر است. در اینجا یک آموزش گام به گام در مورد استفاده از میدجرنی برای ایجاد تصاویر منحصر به فرد تولید شده توسط هوش مصنوعی آورده شده است.

کاربران Discord می توانند از Midjourney.com بازدید کنند، روی دکمه “پیوستن به بتا” کلیک کنند یا مستقیماً به Midjourney Discord بروند. برای کسانی که حساب دیسکورد ندارند، ابتدا برای ایجاد یک حساب کاربری رایگان در دیسکورد ثبت نام کنند و سپس به سرور Midjourney Discord بپیوندند. می‌توانید از هر کجا به Midjourney Discord دسترسی داشته باشید – برنامه‌های وب، موبایل و دسکتاپ.

خرید طرح اشتراک در میدجرنی

هنگامی که این سرویس برای اولین بار در جولای 2022 راه اندازی شد، هر کسی می توانست از آن برای تولید 25 تصویر به صورت رایگان استفاده کند. با این حال، این در آوریل 2023 تغییر کرد و Midjourney برنامه آزمایشی رایگان را متوقف کرد. میدجرنی دیگر به‌جز در دوره‌های کوتاه تبلیغاتی به‌طور رایگان در دسترس نیست. طرح قیمت گذاری در جدول زیر قابل مشاهده است.

برای شروع، می‌توانید به کانال “#Newbies” و سپس یک شماره در سرور Midjourney Discord بروید. کانال های بسیاری برای این کار وجود دارد که شما می توانید از آن ها به عنوان دستور استفاده کنید. یکی از دستورات برای تولید متن در این سایت استفاده از imagine/ است.

به عنوان مثال:

استخراج بیت کوین در رنگ‌های روشن با ظاهری متحرک :imagine prompt/

دستورات ساخت تصویر در میدجرنی

مثال دیگری از این دستور برای ساخت تصاویر با عنوان «عناصر بلاک چین اتریوم در یک محیط فناوری مدرن»، نتیجه زیر را نشان داده شد.

ساخت تصاویر  در میدجرنی

به طور متوسط، Midjourney حدود یک دقیقه طول می کشد تا چهار گزینه اثر هنری ایجاد کند. با این حال، این مشکل ثابت نیست، و اگر کسی بخواهد یک تصویر ارتقا یافته یا یک خروجی با نسبت ابعاد غیر مربعی داشته باشد، زمان ممکن است افزایش یابد.

طرح‌های اشتراک میدجرنی دارای حالت‌های سریع و آرام هستند که سرعت تولید را مطابق طرح مشترک تغییر می دهد. در حالت سریع، شما برای تولید تصاویر نیاز به انتظار ندارید و بدون قرار گرفتن در صف و در سریعترین زمان، درخواست شما انجام می شود. با این حال، حتی گران‌ترین طرح‌های پولی دارای محدودیت ماهانه در تعداد تصاویر تولید شده هستند.

در حالت آرام، درخواست‌های تصویر به یک صف ارسال می شود. تولید می تواند بین یک تا 10 دقیقه طول بکشد.

علاوه بر این، Midjourney یک حالت گران قیمت “Turbo” دارد که می تواند با دستور “turbo/” فعال شود. حالت توربو تصاویر جدید را چهار برابر سریع‌تر تولید می‌کند اما دوبرابر زمان بیشتری را از برنامه اشتراک ماهیانه شما مصرف می‌کند.

برای ذخیره تصویر تولید شده در Midjourney، روی تصویر کلیک کنید تا در اندازه اصلی باز شود و سپس کلیک راست کرده و گزینه Save image را انتخاب کنید. در تلفن همراه، روی تصویر ضربه طولانی بزنید و سپس روی نماد دانلود در گوشه بالا سمت راست ضربه بزنید.

میدجرنی به کاربران این امکان را می دهد که تمام تصاویر ایجاد شده قبلی را مشاهده کنند، از جمله درخواست هایی که برای تولید آنها استفاده می شود. برای دسترسی به تصاویر Midjourney قبلاً ایجاد شده در Discord، به تب Discord Inbox بخش “Mention” بروید و تصاویر قبلی را دانلود کنید.

تصاویر Midjourney در مالکیت عمومی هستند و مالکیت آن منبع باز است. Midjourney خود را به عنوان یک جامعه باز توصیف می کند که به دیگران اجازه می دهد از تصاویر و درخواست‌ها هنگام ارسال در یک محیط عمومی استفاده کرده و دوباره میکس کنند. به طور پیش‌فرض، همه تصاویر در میدجرنی به صورت عمومی قابل مشاهده و ترکیب مجدد هستند. بنابراین، هر کسی می تواند به آنها دسترسی داشته باشد و آنها را اصلاح کند. این امر فروش آثار هنری میدجرنی را مشکوک می کند.

Dall-E 2 یک مدل متن به تصویر و جانشین Dall-E است که توسط آزمایشگاه تحقیقاتی OpenAI که ChatGPT را راه‌اندازی کرد، ساخته شده است. در سال 2019، OpenAI بیش از 1 میلیارد دلار از مایکروسافت و Khosla Ventures دریافت کرد و در ژانویه 2023، پس از راه اندازی Dall-E 2 و ChatGPT، این شرکت توانست 10 میلیارد دلار بودجه اضافی از مایکروسافت دریافت کرد. Midjourney توسط یک آزمایشگاه مستقل به نام Midjourney Inc ساخته شده است.

در حالی که Dall-E 2 و Midjourney مبتنی بر توصیف‌های زبان طبیعی هستند که تصاویر را از دستورات تولید می‌کنند، استفاده به الزامات و ترجیحات خاص بستگی دارد. برخی از تفاوت‌ها به شرح زیر است:

  • دسترسی: Midjourney از طریق Discord قابل دسترسی است، در حالی که Dall-E 2 فقط از طریق وب سایت OpenAI در دسترس است.
  • وضوح تصویر: Midjourney می تواند تصویری با وضوح 1792×1024 ایجاد کند، در حالی که Dall-E 2 وضوح تصویر 1024×1024 را تولید می کند.
  • اشتراک: هر دو دارای طرح‌های اشتراک هستند و کاربران می توانند نرخ‌های به روز شده را در وب سایت‌های مربوطه بررسی کنند تا ببینند کدام یک برای آنها مناسب تر است.

Midjourney هنرمندان را قادر می سازد تا سبک‌ها، مضامین و مفاهیم مختلف هنری را کشف کنند، خلاقیت را پرورش دهند و مرزهای اشکال هنری سنتی را پیش ببرند. هنرمندان می‌توانند با پارامترها و تکنیک‌های متعددی آزمایش کنند، که منجر به خروجی‌های همه‌کاره از ترکیب‌بندی‌های انتزاعی تا نمایش‌های واقعی می‌شود. به دلیل چرخش سریع هوش مصنوعی برای تولید تصاویر، در زمان صرفه جویی می شود.

علاوه بر این، ادغام با پلتفرم‌هایی مانند Discord، جنبه‌های مشارکتی میدجرنی را افزایش می‌دهد و به هنرمندان اجازه می‌دهد ایده‌ها، تکنیک‌ها و خلاقیت‌ها را در جامعه‌ای از افراد همفکر به اشتراک بگذارند.

علاوه بر بیان هنری، برای ایجاد تصاویر محصول، تصاویر، خلاقیت‌های رسانه‌های اجتماعی، وثیقه‌های بازاریابی، پروژه‌های هنری نشانه‌های غیرقابل تعویض (NFT)، تجسم‌های معماری و موارد دیگر سودمند است.

در حالی که هنر هوش مصنوعی قانونی است، پیامدهای اخلاقی آن چند وجهی است و شامل ملاحظات مربوط به خلاقیت، مالکیت، تعصب و تأثیر اجتماعی است. بحث رایج این است که اگرچه ابزارهای هوش مصنوعی به ایجاد کمک می کنند، ورودی و راهنمایی از سوی انسان‌ها می آید. رهنمودهای روشن در مورد انتساب و مالکیت برای پرداختن به این مسائل ضروری است.

استفاده تجاری از هنر تولید شده توسط هوش مصنوعی سوالاتی را در مورد غرامت عادلانه و پتانسیل سرقت ادبی ایجاد می کند. هنرمندان باید از پیامدهای اخلاقی فروش آثار تولید شده توسط هوش مصنوعی و نحوه همسویی آن با هنجارهای تثبیت شده در دنیای هنر آگاه باشند.

مدل‌های هوش مصنوعی بر روی مجموعه‌های داده‌ای آموزش داده می‌شوند که ممکن است دارای سوگیری‌های موجود در داده‌ها باشند – سوگیری‌های جنسیتی، نژادی یا فرهنگی. این می تواند به طور ناخواسته به خروجی‌های مغرضانه منجر شود و کلیشه‌ها یا تعصبات موجود را تقویت کند. هنرمندان و توسعه دهندگان باید از این تعصبات آگاه باشند و برای کاهش آنها تلاش کنند.

منابع محاسباتی مورد نیاز برای آموزش و اجرای مدل‌های پیشرفته هوش مصنوعی مانند Midjourney و Dall-E 2 نگرانی‌های زیست‌محیطی را ایجاد می‌کند. گفتمان اخلاقی باید ردپای کربن مرتبط با عملیات هوش مصنوعی در مقیاس بزرگ را در نظر بگیرد.

منبع خبر: cointelegraph.com

لینک مطلب: Midjourneyچیست و چگونه از آن برای ایجاد هنر هوش مصنوعی استفاده کنیم؟